\documentclass[a4paper,11pt]{article} % format du document
\usepackage[utf8x]{inputenc} % encodage des caracteres
\usepackage[francais]{babel} % alinea au debut des sections, sous-sections,...
\usepackage{fullpage} % marges plus classiques
\usepackage{graphicx} % \includegraphics[]{}
\usepackage{float} % gestion des figures
\usepackage{subfig} % gestion des figures
\usepackage{url} % \url{http://}
\usepackage{color} % definition de nouvelles couleurs
\usepackage{amsmath} % tabular
\usepackage{amsfonts} % \mathbb{N}
\usepackage{amssymb} % \mathbb{N}
\usepackage[pdftex,                %
    bookmarks         = true,%     % Signets
    bookmarksnumbered = true,%     % Signets numerotes
    pdfpagemode       = None,%     % Signets/vignettes ferme a l'ouverture
    pdfstartview      = FitH,%     % La page prend toute la largeur
    pdfpagelayout     = SinglePage,% Vue par page
    colorlinks        = false,%     % Liens en couleur
    pdfborder         = {0 0 0}%   % Style de bordure : ici, pas de bordure
    ]{hyperref}%                   % Utilisation de HyperTeX

\hypersetup {
colorlinks=false;
bookmarks=true;
pdftitle={Titre du document}
pdtauthor={Huraux Thomas et Christophe Labedan}
pdfsubject={Sujet du document}
pdfcreator  = {PDFLaTeX}
pdfproducer = {PDFLaTeX}
}

\newcommand{\Abstract}[1]{\begin{abstract}\textit{#1}\end{abstract}\vspace{1cm}}

\author{Thomas Huraux - Christophe Labedan}
\title{R\'eseau bay\'esien pour repr\'esenter la m\'et\'eo de Metz}
\date{4 mai 2010}

\begin{document}
\maketitle

\vfill
\tableofcontents
\vfill
\newpage

\Abstract{Les r\'eseaux bay\'esiens reposent sur la th\'eorie des graphes, et celle des probabilit\'es. Ils associent aux propri\'et\'es concernant la circulation de l'information dans les graphes une s\'emantique li\'ee aux probabilit\'es conditionnelles. Ce type d'outil permet souvent d'obtenir des r\'esultats tr\`es satisfaisant \`a de nombreux probl\`emes.}

\section{Introduction}
Le but de ce projet est de construire un r\'eseau bay\'esien pour pr\'evoir la m\'et\'eo de Metz. Ceci s'appuie sur un ensemble de relev\'es m\'et\'eorologiques fournis avec le sujet. Le projet consiste en un programme Java qui permet d'importer et d'analyser ces donn\'ees. Dans un premier temps, il a fallu d\'efinir correctement les interactions entre les param\`etres m\'et\'eo donn\'es. Cette \'etape permet de mettre en \'evidence les liens de causalit\'e entre les donn\'ees, mais \'egelement d'\'eliminer certains param\`etres, dont l'influence est minimale. Ensuite, les tables de probabilit\'es associ\'ees \`a chaque noeud ont \'et\'e construites pour compl\'eter le r\'eseau. Enfin, une \'evaluation du mod\`ele a \'et\'e r\'ealis\'ee pour se rendre compte de son efficacit\'e.

\section{Exploitation des donn\'ees}
Avec le sujet sont fournis des relev\'es m\'et\'eorologiques de 2006 \`a 2008. Chacun de ces relev\'es est dat\'e et contient des informations sur la pression, la temp\'erature les pr\'ecipitations, $\dots$ Dans un premier temps, il s'agit de r\'ecup\'erer ces donn\'ees. Il faut pour cela les discr\'etiser en suivant les directions propos\'ees dans le sujet. Ceci est r\'ealis\'e avec la classe \verb|DataMeter|, qui contient \`a la fois les d\'efinitions d'intervalles pour chaque param\`etre, et une m\'ethode (\verb|createJour|) pour ``convertir'' les variables continues en variables discr\`etes. Cela signifie que chaque relev\'e sera converti en l'intervalle qui lui correspond.


\section{Construction du r\'eseau bay\'esien}
Afin de produire un r\'eseau bay\'esien simple et faciliter son utilisation, on calcule le coefficient de corr\'elation entre les diff\'erentes variables. Ce coefficient permet de d\'ecouvrir  \`a quel point deux variables sont li\'es. Cette mesure est obtenue gr\^ace au coefficient de corr\'elation lin\'eaire de Bravais-Pearson :


Avec les tableaux de valeurs suivants $X (x_1, \ldots, x_n)$  et $Y (y_1, \ldots, y_n) $  
$$ c=\frac{\sum_{i=1}^{N}(x_{i}-\bar{x})\cdot(y_{i}-\bar{y})}{\sqrt{\sum_{i=1}^{N}(x_{i}-\bar{x})^{2}} \cdot \sqrt{\sum_{i=1}^{N}(y_{i}-\bar{y})^{2}} } $$

Voici les corr\'elations obtenues :

\begin{verbatim}
==================================
Correlations lineaires
==================================

- TEMPERATURE et DEWPOINT (0.89)
- TEMPERATURE et WINDTEMP (0.98)
- DEWPOINT et WINDTEMP (0.87)
\end{verbatim}

Les variables temp\'erature, point de ros\'ee et temp\'erature du vent sont fortement corr\'el\'es. On ne conservera donc que la temp\'erature.

\subsection{Recherche de d\'ependances}

La recherche de d\'ependances probabilistes permet de deviner la structure du r\'eseau bay\'esien. Deux variables sont ind\'ependantes si :

$$ P(A\cap B)=P(A) \cdot P(B) $$

Voici les d\'ependances obtenues :

\begin{verbatim}
==================================
Dependance probabiliste
==================================

- TEMPERATURE et DEWPOINT
- TEMPERATURE et WINDTEMP
- HUMIDITY et RAIN
- PRESSURE et RAIN
- WIND et SQUALL
- DEWPOINT et WINDTEMP
\end{verbatim}

\subsection{Le r\'eseau}
L'\'etape suivante consiste \`a tracer le graphe correspondant aux informations obtenues. Une lecture de ces analyses permet d'obtenir le graphe suivant :
\begin{figure}[htbp]
 \centering
 \includegraphics[width=.7\linewidth]{../img/network.png}
\end{figure}
\par Le graphe peut se lire dans les deux sens : Si la pression est connue, alors la pluie d\'epend de la pression, de l'humidit\'e et du vent. Sinon (aucune connaissance sur la pression), elle d\'epend de la temp\'erature, de l'humidit\'e et du vent.
\par Ces d\'ependances correspondent globalement \`a la r\'ealit\'e, ce qui permet d\'ej\`a dans un premier temps de v\'erifier le mod\`ele. Don efficacit\'e sera mesur\'ee plus loin, dans la partie \ref{efficacite}.

\section{Cr\'eation des tables}
Maintenant que les d\'ependances conditionnelles sont d\'etermin\'ees, il faut construire les tables \`a associer \`a chaque noeud du graphe. Pour r\'ealiser cette transposition, il faut \'etablir une correspondance entre le graphe et les probabilit\'es. Ainsi, pour le tableau $P(Pression|Temp\acute{e}rature)$ par exemple, chaque couple d'intervalles $(pression,temp\acute{e}rature)$ correspond \`a un \'ev\`enement de l'espace probabilis\'e; il en va de m\^eme pour chacun des tableaux du mod\`ele. La construction suit le r\'esonnement suivant : si le noeud A a n parents p, alors il faut cr\'e\'er le tableau $P(A|\linebreak[1]p_1,\dots,p_n)$. La repr\'esentation probabiliste du graphe se fait donc gr\^ace aux tables suivantes : $P(Temp\acute{e}rature)$, $P(Pression|\linebreak[1]Temp\acute{e}rature)$, $P(Humidit\acute{e})$, $P(Vent)$ et $P(Pluie|\linebreak[1]Humidit\acute{e},Pression,Vent)$; il y a alors \'equivalence entre le mod\`ele graphique et le mod\`ele probabiliste, qui est implant\'e dans le programme. Les tableaux de probabilit\'es sont contenus dans la classe \verb|NetworkTables|, et cr\'e\'es gr\^ace \`a \verb|Table|.

\section{Test d'efficacit\'e \label{efficacite}}
Pour avoir une id\'ee de la performance du syst\`eme mis en place, un test a \'et\'e mis en place. Le principe de celui-ci est de d\'eterminer les pr\'ecipitations potentielles en fonctions de la pression, de l'humidit\'e et du vent. Le r\'esultat est alors compar\'e \`a la pluie r\'eelle. Ce test, implant\'e dans la fonction \verb|NetworkTables.testPerformance()| mesure une efficacit\'e de 71\%. Le mod\`ele est donc relativement performant, mais il pourrait sans doute \^etre am\'elior\'e. 
\par Pour tenter d'obtenir de meilleurs r\'esultats, une approche markovienne a \'et\'e faite, en faisant intervenir la connaissance des mesures du jour pr\'ec\'edent. Toutefois, la mesure des performances de ce nouveau mod\`ele a \'et\'e inf\'erieure \`a celle du pr\'ec\'edent, avec environ 68\% d'efficacit\'e. La premi\`ere approche a donc \'et\'e conserv\'ee.

\section{Utilisation}

\section{Conclusion}
Le r\'eseau bay\'esien construit dans ce projet est une mod\'elisation de la m\'et\'eo pour Metz, il peut en exister d'autres, plus ou moins performants. Celui-ci permet d'obtenir des r\'esultats assez bons, mais il demanderait \`a \^etre enrichi pour \^etre v\'eritablement efficace. Pour cela, d'autres connaissances sur la thermodynamique pourraient \^etre utiles, car cette discipline est tr\`es fortement li\'ee \`a la m\'et\'eorogie. Ceci permettrait de mieux analyser les influences des diff\'erents param\`etres par exemple.


\end{document}
